#Google Gemini
Gemini 3.1 Pro突襲:推理能力翻倍,Google打響AI"小步快跑"第一槍
引言當行業還在期待GPT-5.3時,Google用一場".1"版本號革命重新定義了AI迭代節奏。2026年2月24日凌晨,Google突然發佈Gemini 3.1 Pro大模型,這是其首次採用".1"小版本號,但升級幅度卻遠超預期。在ARC-AGI-2基準測試中,Gemini 3.1 Pro得分77.1%,是Gemini 3 Pro(31.1%)的2倍還多。這一突破不僅刷新了Google自身的技術紀錄,更標誌著大模型行業正式進入"高頻小步快跑"的新時代。更關鍵的是定價策略:每百萬token輸入僅2美元,輸出10美元,這一價格直接對標Anthropic Sonnet 4.6,在保持性能領先的同時實現了成本的大幅最佳化。Google用行動證明,AI競爭不再是"參數軍備競賽",而是"效率與速度的比拚"。01 技術突破:推理能力的量子躍遷Gemini 3.1 Pro最引人注目的突破在於推理能力的翻倍提升。傳統大模型升級往往聚焦於參數規模或多模態能力,而Google此次選擇了更艱難的路徑——從根本上提升模型的邏輯推理和問題解決能力。ARC-AGI-2基準測試的77.1%得分意味著什麼?這一測試專門評估AI系統的抽象推理能力,要求模型從有限示例中歸納出通用規則,並應用於全新場景。77.1%的得分不僅超越了所有前代Gemini模型,更接近了人類專家的表現水平。對比之下,GPT-5.2在同一測試中的得分為68.3%,Claude Opus 4.6為72.8%。多模態能力的全面進化同樣令人印象深刻。Gemini 3.1 Pro支援100萬token超長上下文窗口,能夠一次性處理整本書等級的文件或大型程式碼庫。在創意程式設計方面,模型能夠直接生成3D版"椋鳥群飛"動畫,並支援手勢追蹤互動,實現了從靜態內容生成到動態互動體驗的跨越。vibe coding能力的同步增強為開發者帶來了全新體驗。模型能夠更好地理解程式碼背後的設計意圖和架構邏輯,而不僅僅是語法正確性。實測資料顯示,在處理複雜演算法重構、架構最佳化等任務時,Gemini 3.1 Pro的精準率比前代提升45%。02 行業意義:從"整數版本"到".1迭代"的範式轉變Google首次採用".1"小版本號,這一看似微小的變化背後,是AI行業發展邏輯的根本性轉變。高頻小步快跑成為新常態。傳統上,大模型迭代以整數版本為單位,升級周期長達數月甚至半年。Gemini 3.1 Pro的發佈預示著,未來AI能力的進化將更加頻繁、更加精細。預計未來6個月內,我們將看到更多".1"、".2"等級的快速迭代,而非傳統的整數版本更新。企業應用更新機製麵臨重構。對於依賴AI服務的企業而言,這意味著需要建立更敏捷的AI應用更新機制。傳統"一年一升級"的節奏將被打破,企業需要能夠快速適配模型能力的持續最佳化,保持競爭優勢。技術競爭維度更加多元。當版本迭代頻率提升,競爭不再侷限於"誰先發佈大版本",而是"誰能持續提供最優體驗"。這要求廠商在模型最佳化、工程效率、生態建設等多個維度保持領先。使用者受益程度顯著提升。更頻繁的迭代意味著使用者能夠更快享受到技術進步帶來的價值。無論是開發者工具的增強,還是消費級應用的體驗最佳化,都將以更快的節奏呈現給終端使用者。03 定價策略:性能領先下的成本最佳化Gemini 3.1 Pro的定價策略同樣體現了Google的戰略思考。每百萬token輸入2美元、輸出10美元的價格,在保持性能領先的同時,實現了對競品的成本優勢。對比分析顯示:相比Anthropic Sonnet 4.6(輸入3美元、輸出15美元),Gemini 3.1 Pro便宜33%相比OpenAI GPT-5.2 Turbo(輸入5美元、輸出15美元),成本優勢更加明顯在相同預算下,企業可以處理更多token量,實現更高的投入產出比中小企業市場成為重點。傳統高性能AI服務主要被大型企業壟斷,而Gemini 3.1 Pro的親民定價,意味著更多中小企業能夠負擔得起頂尖AI能力。這對於加速AI技術普惠、推動行業數位化轉型具有重要意義。開發者生態的吸引力增強。對於個人開發者和初創團隊而言,成本是選擇AI服務的關鍵考量。Gemini 3.1 Pro的性價比優勢,將吸引更多開發者加入Google生態,推動應用創新的繁榮。04 生態佈局:從模型到應用的全鏈路最佳化Gemini 3.1 Pro的發佈不是孤立事件,而是GoogleAI生態戰略的重要一環。Gemini App已全面上線。普通使用者可以通過Gemini App直接體驗新模型,享受比前代更精準的複雜問題解答能力。實測顯示,在處理數學證明、邏輯推理、專業諮詢等任務時,新模型的精準率和響應速度均有顯著提升。API服務的全面升級。開發者可以通過Gemini API快速接入新模型,享受推理能力翻倍帶來的效率提升。Google同時最佳化了API的穩定性和響應速度,確保企業級應用的高可用性。多模態創作工具鏈完善。結合Gemini 3.1 Pro強大的多模態能力,Google推出了全新的創意工具套件,支援"文生視訊+互動"的新型內容形式。這對於內容創作者、教育工作者、行銷人員等群體具有重要價值。企業級解決方案深化。針對金融、醫療、法律等垂直行業,Google提供了基於Gemini 3.1 Pro的定製化解決方案,幫助企業在保持資料安全的前提下,享受AI技術帶來的效率提升。05 競爭格局:三巨頭技術路線的分化Gemini 3.1 Pro的發佈,進一步凸顯了AI三巨頭技術路線的分化。Google的"推理優先"路線。通過持續最佳化模型的邏輯推理能力,Google正在建構差異化的技術優勢。在需要複雜問題解決、專業諮詢、科學計算等場景中,Gemini系列的表現日益突出。OpenAI的"通用能力"路線。GPT系列繼續強化其通用性和適應性,在保持各方面能力均衡的同時,通過規模效應降低成本。但整數版本迭代周期較長,可能面臨敏捷性挑戰。Anthropic的"安全與專業"路線。Claude系列在AI安全、專業任務處理上持續深耕,特別是在程式碼安全、法律合規等垂直領域建立了獨特優勢。但定價相對較高,可能限制其規模化應用。國產大模型的追趕壓力。雖然DeepSeek、智譜GLM-5等國產模型在特定領域表現出色,但在推理能力的系統性提升上仍需追趕。Gemini 3.1 Pro的發佈,為國產模型提供了重要的技術參考和競爭標竿。06 實測體驗:從"工具"到"思維夥伴"的進化對於一線使用者而言,Gemini 3.1 Pro帶來的體驗升級是實實在在的。複雜問題處理能力顯著提升。在測試中,模型能夠準確解答研究生等級的數學證明題,理解複雜的法律條文邏輯,提供專業的醫療諮詢建議。這種能力的提升,讓AI從簡單的資訊檢索工具,進化為真正的"思維夥伴"。長文件理解更加精準。得益於100萬token的上下文窗口,模型能夠準確理解整本書、大型程式碼庫、複雜研究報告的內容。在處理學術論文審稿、程式碼架構評審等任務時,表現接近人類專家水平。創意表達更加豐富。在內容創作測試中,模型不僅能夠生成高品質的文字內容,還能夠創作互動式動畫、設計複雜的資料可視化圖表、製作專業的簡報。這種多模態創作能力,為創意工作者提供了全新的工具。響應速度持續最佳化。官方資料顯示,Gemini 3.1 Pro的響應時間相比前代縮短30%,在處理複雜推理任務時,使用者能夠感受到明顯的流暢度提升。也看到了Gemini新增的製作音樂模組(終於有人挑戰suno了),試了一下做一首30秒的武俠歌曲,完成度也很不錯。gemini給我做的國風武俠電影主題曲07 未來展望:AI發展的新節奏與新挑戰Gemini 3.1 Pro的發佈,不僅是一個產品的升級,更預示著AI行業發展的新節奏。技術迭代的加速度。".1"版本號的出現,意味著技術進步的顆粒度更加精細,迭代頻率更加密集。這要求整個行業建立更加敏捷的研發體系、更加靈活的部署架構、更加智能的測試方法。應用創新的新機遇。更強大的推理能力,將催生更多創新應用場景。從智能教育輔導到專業諮詢服務,從科學計算輔助到複雜決策支援,AI的應用邊界將持續擴展。人才需求的結構性變化。隨著AI能力的快速進化,對AI人才的需求將從"模型訓練專家"向"應用創新專家"轉變。能夠將AI能力與行業需求深度結合的人才,將成為市場的新寵。倫理治理的緊迫性。更強大的推理能力,也帶來了新的倫理挑戰。如何確保AI系統的決策透明、公平、可控,將成為行業必須面對的重要課題。結語Google的這次".1版本突襲",表面上是技術升級,深層則是行業競爭邏輯的根本性轉變。當AI發展從"整數版本躍進"轉向"小數版本迭代",整個行業的節奏、格局、規則都將被重新定義。推理能力的翻倍提升,不僅僅是技術參數的最佳化,更是AI從"資訊處理工具"向"智能思維夥伴"進化的重要里程碑。在這個AI重新定義一切的時代,能夠率先突破推理瓶頸、建構持續最佳化能力的企業,將掌握下一個階段的發展主動權。真正的競爭才剛剛開始。技術優勢需要轉化為生態優勢,單點突破需要擴展為系統領先。對於全球AI產業而言,Gemini 3.1 Pro的發佈既是挑戰,也是機遇。在這個AI從"炫技"走向"實用"的關鍵轉折點,能夠平衡技術創新與商業落地的企業,將引領行業進入更加成熟、務實的新階段。當矽谷醒來時,會發現AI競爭的規則已經改變。這場始於".1版本號"的技術革命,或許將開啟全球AI發展的新篇章——一個更加注重實用性、可及性和可持續性的新篇章。 (遊戲AI說)
Google Gemini最“小”的一次迭代,姚順宇為何高呼“不可阻擋”?
人們還在津津樂道OpenAI和Anthropic兩家公司的老闆拒絕牽手,以至於握拳高舉的滑稽畫面,另一邊,Google一個反手迭代了模型。而且這次迭代,頗像是狼披上了羊皮——從模型後綴的數字序號看,這是Google最“小”的一次迭代,之前都是從Gemini 2.0到Gemini 2.5這樣的迭代,這次從Gemini 3.0到Gemini 3.1Pro Preview。但是這“.1”的迭代,進步得卻不是一星半點。GoogleCEO皮查伊(Sundar Pichai)表示,新代模型非常擅長處理“超級複雜的任務”。例如將複雜概念可視化、將資料綜合成單一檢視或者將創意項目變為現實。姚順宇也專門在X上發帖為Gemini 3.1 Pro Preview振臂,盛讚:“Gemini不僅僅是一個好模型,更好的模型正在以不可阻擋之勢到來。”需要注意的是,大約一周前,Google推出了“專用推理模式”Gemini 3 Deep Think,專為科學、研究、工程等複雜、開放式問題設計。Demini 3 Deep Think是姚順宇從Anthropic跳槽到GoogleDeepMind之後參與的第一個項目。而如今的Gemini 3.1 Pro Preview和Gemini 3 Deep Think有千絲萬縷的關係,官方表示“直接建構在Gemini 3 Deep Think的經驗和技術之上”。相當於把Deep Think的核心推理提升技術“下放”到更廣泛可用的Pro模型中。01Gemini 3.1 Pro Preview能做什麼既然這次新代模型的突出能力在處理“超級複雜”的任務,那麼普通的對話放一邊,Google的官方博文中,重點給出了幾種示例秀肌肉。第一,通過簡單的提示詞,建立SVG動畫。這個功能前代也有,但是對比之下進步明顯。比如提示詞“生成一個SVG,描繪一隻變色龍靜靜地坐在樹枝上。讓變色龍的眼睛跟隨使用者的滑鼠游標在螢幕上移動。”Gemini 3 Pro生成的動畫背景是單一的白色,變色龍也看起來很呆板,甚至一側有兩隻眼睛。Gemini 3.1 Pro生成的動畫則有豐富的“深綠色叢林”背景,變色龍身體有黃色斑紋和圓點裝飾,眼睛立體,腿部姿勢自然彎曲。再比如提示詞“生成一個滑動切換開關的SVG,當滑鼠懸停在太陽圖示上時,將其變成發光的月亮,同時背景從明亮平滑漸變到黑暗。採用乾淨的扁平UI風格。”Gemini 3 Pro給出的動畫雖然完成了任務,圖示可以隨滑鼠變化,但是主圖示單一,是一個缺角的圓形圖案,用黃色代表白天,白色代表夜間。Gemini 3.1 Pro生成的動畫要複雜得多,白天是黃日白雲,夜間是月牙繁星,兩套圖示絲滑變換。總而言之,Gemini 3 Pro做的動畫,讓人想起多年前那個“學了三年動畫”的梗。而Gemini 3.1 Pro交付的SVG動畫,已經達到了可以直接使用的效果。第二,建構工程等級系統。Gemini 3.1 Pro已經可以根據一段高複雜度的自然語言指令,直接生成一個集3D渲染、即時太陽星曆計算、API非同步拉取和物理光效於一體的完整互動系統,而不是簡單頁面demo。Google給出的示例中,使用者給出文字指令,Gemini 3.1 Pro生成了建構一個高保真、可互動的3D國際空間站(ISS)軌道追蹤器。使用高解析度的Blue Marble紋理貼圖渲染一個精細的3D地球模型。第三,生成互動式創意系統。在另一個示例中,Google展示了Gemini 3.1 Pro編寫的一個複雜的3D椋鳥群舞(murmuration)模擬。它不僅生成視覺程式碼,還建構了一個沉浸式體驗,使用者可以通過手部追蹤操控鳥群,並聆聽根據鳥群運動變化的生成式配樂。對於研究人員和設計師而言,這提供了一種強有力的方式來原型化感官豐富的介面。第四,將文學主題轉化為可運行的程式碼。這個示例可能是普通人也最容易get到厲害之處的一個。當被要求為艾米莉·勃朗特(Emily Brontë)的《呼嘯山莊》(Wuthering Heights)打造一個現代個人作品集網站時,該模型並未簡單地總結文字內容,而是基於小說的氛圍與情緒進行推理,設計出一個簡潔、當代感十足的介面,建立出一個捕捉主人公精神核心的網站。抽象推理,這種能力的含金量不用多說。02到底有多強?新代模型免不了過一下刷榜這一步。而“.1”的升級,獲得了動輒倍數躍升的成績。根據Google官方博文放出的測試結果,在ARC-AGI-2基準測試中,3.1 Pro的驗證得分達到了77.1%。比3 Pro的推理性能提升了一倍以上。這也符合3.1 Pro的示例,因為這個測試評估的是模型解決全新邏輯模式的能力。用人話說就是,抽象推理解謎的能力。此外,在GPQA Diamond(科學知識測試)中,3.1 Pro得分94.3%;智能體類基準MCP Atlas上,得分69.2%;真實網路瀏覽與資訊整合能力的基準BrowseComp上,得分85.9%。這些成績,均超過了Anthropic的Sonnet 4.6、Opus 4.6,以及OpenAI的GPT-5.2與GPT-5.3-Codex。GoogleGemini 3.1 Pro這次在ARC抽象推理和BrowseComp搜尋任務上顯著拉開差距,顯示出明顯的Agent傾向,而非單純知識模型。此外,專門做大模型基準測試與對比分析的第三方評測機構也發佈了相關測試結果,大讚Gemini 3.1 Pro在構成Artificial Analysis Intelligence Index的10項評測中領先6項,相較於Gemini 3 Pro Preview在多項能力上顯著提升,尤其是在推理與知識、程式碼能力以及降低幻覺方面進步最大。而且,Gemini 3.1 Pro Preview保持較高的token效率。運行完整Artificial Analysis Intelligence Index約需5700萬token(比Gemini 3 Pro Preview多100萬)。這一token使用量低於其他在最大推理模式下運行的前沿模型,如Opus 4.6(max)和GPT-5.2(xhigh)。結合更低的單token定價,Gemini 3.1 Pro Preview在前沿模型中具有成本優勢,運行完整Intelligence Index的成本不到Opus 4.6(max)的一半,不過仍約為領先開源模型GLM-5的兩倍。03能力翻倍價格不變Google官方API定價顯示,Gemini 3 Pro/3.1 Pro Preview的收費結構是按token計費的:小於200k tokens時,每百萬token輸入約2美元,輸出價格為4美元。大於200k tokens時,每百萬token輸入4美元,輸出18美元。在上下文快取方面,根據提示詞規模,每百萬 token 收取 0.20 至 0.40 美元,外加每小時每百萬 token 4.50 美元的儲存費。這個價格,整體上和Gemini自己的上一代3 Pro一致,但要是和 Anthropic Opus 系列比起來,還是相對便宜的。 Opus這類模型輸入/輸出單價能在$5/$25左右。尤其是結合當下它在模型能力上相當突出,這個價格更顯得極具競爭力。不要忘了,Google這次發佈的只是“預覽(Preview)”,Google很快就會推出正式版。而“.1”的迭代,Google也是在暗示其只是小秀肌肉。目前,開發者可以在AI Studio、Gemini API、Gemini CLI、智能體開發平台Google Antigravity以及Android Studio使用3.1 Pro;企業使用者則可以在Vertex AI和Gemini Enterprise使用;普通使用者在Gemini應用和NotebookLM都能用上,不過後者僅限Pro和Ultra訂閱使用者。各個社區裡已經有不少人迫不及待上手操作,真的就和Google的演示一樣,手搓了不少驚豔的玩意。有人用Gemini 3.1 Pro 生成了一個可互動的 3D 機械級汽車懸架系統模擬器,包含真實幾何結構、連桿約束與即時轉向和行程計算,相當於把機械工程建模、物理邏輯和3D可視化一次性寫成可運行工具,接近工程級原型能力。有人用3.1 Pro製作“捉鬼獵人走過一棟鬧鬼的房子”的循環動畫,驚呼“Gemini沒有開玩笑”。總之,Google這回是真憋了個大招。小小一個“.1”,卻把推理和程式碼能力拉得飛起,定價還這麼穩。社區裡滿溢的手搓demo的熱情,也證明了它的能力與實用性。AI圈越來越現實了。模型再強,終究得看帳單值不值。企業開始精打細算每個token的回報,開發者也得掂量掂量性價比。Google這一步,不僅是搶回王座,更是把競爭推向“誰更會過日子”的新階段。且看接下來,捏著拳頭的Anthropic和OpenAI,以及xAI、Meta、微軟等一眾競爭對手該如何應對吧。 (字母AI)
Google殺瘋了Gemini 3 推理模式封神,碾壓 GPT-5.2,科研工程界迎終極神器
2026 年 AI 科研賽道再迎王炸!Google官宣 Gemini 3 Deep Think 推理模式重磅升級,劍指科學研究與工程落地的複雜難題,多項基準測試成績直接刷新全球紀錄,不僅碾壓 GPT-5.2、Claude Opus 4.6 等競品,更達到世界頂尖程式設計師、奧賽金牌級水平。更重磅的是,Google首次開放該模式 API 早期訪問,科研人和工程師的效率天花板,直接被重新定義!實測封神!全維度霸榜,多項成績碾壓主流大模型此次升級的 Gemini 3 Deep Think,最硬核的底氣就是實打實的測試成績,在數學、物理、程式設計、抽象推理等全維度高難度基準測試中,實現全面霸榜,無工具加持下的表現堪稱驚豔。在抽象推理核心測試 ARC-AGI-2 中,它拿下 84.6% 的超高正確率,遠超 Claude Opus 4.6 的 68.8% 和 GPT-5.2 的 52.9%,成績直接斷層領先。“終極人類考試” 中,48.4% 的得分也甩開 Claude 的 40.0%、GPT-5.2 的 34.5%,盡顯高階推理實力。程式設計領域更是直接封神,Codeforces 競賽程式設計基準中斬獲 3455 的 Elo 評分,遠超 Gemini 3 原版的 2512 和 Claude 的 2352,達到世界頂尖程式設計師水準。而在 2025 年國際奧賽中,數學、物理、化學理論測試均拿下金牌級成績,物理更是達到 87.7% 的正確率,把 GPT-5.2 的 70.5% 遠遠甩在身後。就連多模態理解、凝聚態物理理論等偏門高難領域,它也表現亮眼,MMMU-Pro 測試 81.5% 正確率、CMT-Benchmark 50.5% 得分,均大幅領先主流競品,真正實現了 “文理通吃、科工全能”。直擊痛點!專為科研工程而生,破解真實場景難題Google此次升級並非單純的參數堆砌,而是精準瞄準科研和工程場景的核心痛點 —— 真實工作中資料雜亂、問題邊界模糊、需要長鏈路邏輯推理,而 Deep Think 就是為解決這些問題量身打造。它摒棄了大模型常見的 “表面化推理”,擁有更深度的邏輯鏈分析能力,能處理科研中複雜的因果推導、工程裡精密的流程最佳化。Google已展示其實際應用價值:協助數學家快速發現論文中的邏輯漏洞,從繁雜的公式推導中定位問題;助力工程師最佳化半導體晶體生長工藝,通過多維度資料分析找到工藝提升的關鍵節點。不同於普通大模型只能做 “輔助性文案工作”,Deep Think 能真正深度參與科研和工程的核心環節,從理論分析到實際落地,提供可落地、可驗證的解決方案,讓 AI 從 “工具” 變成真正的 “科研夥伴”。重磅開放!API 解鎖,兩類使用者率先嘗鮮在成績亮眼、應用落地的雙重加持下,Google此次也邁出了關鍵一步 —— 打破封閉,首次開放 Gemini 3 Deep Think 的使用權限,讓頂尖 AI 能力走出實驗室,真正服務於科研和產業界。目前該模式已面向Google AI Ultra 訂閱使用者全面開放,這類使用者可直接體驗全功能的深度推理能力。更值得關注的是,Google首次通過Gemini API,向部分研究人員、工程師及企業提供早期存取權,這意味著相關從業者可將該模型接入自有系統、科研平台,實現定製化的深度應用。從以往的 “專屬封閉” 到如今的 “有限開放”,Google的這一動作,也讓全球科研和工程界看到了頂尖 AI 技術普惠的可能,未來無論是高校的基礎研究,還是企業的工程落地,都有望借助這一工具實現效率躍升。行業震動!AI 科研工具迎來新拐點,競爭再升級Gemini 3 Deep Think 的升級與開放,不僅讓科研人和工程師迎來 “效率神器”,更在全球 AI 行業引發連鎖震動,讓大模型的競爭從 “通用能力比拚” 轉向 “專業場景深耕”。此前,主流大模型更多聚焦於通用對話、內容生成,在專業科研工程領域的表現始終差強人意,而Google此次精準卡位高難度專業場景,用實打實的成績證明了大模型在硬核領域的落地價值。這也給其他 AI 廠商指明了方向:單純的參數競賽已無意義,能解決真實專業問題的模型,才擁有真正的核心競爭力。對於科研和工程界而言,這一升級更是一場效率革命 —— 以往需要團隊數天甚至數月的邏輯推導、工藝最佳化、程式碼編寫,如今借助 Deep Think 可能幾小時就能完成,大大縮短了研究和開發周期。而隨著 API 的逐步開放,未來還將催生更多基於該模型的專業工具,推動科研和工程領域的智能化升級。從全維度霸榜的測試成績,到直擊痛點的場景落地,再到打破封閉的 API 開放,Google Gemini 3 Deep Think 的此次升級,每一步都踩在了 AI 行業的核心發展點上。它不僅展現了Google在大模型領域的技術領先,更讓我們看到了 AI 賦能硬核科研、推動產業升級的無限可能。隨著頂尖 AI 技術的逐步普惠,科研和工程的智能化時代,已然加速到來! (硬核科技喵)
Google最新大模型強力刷榜,Gemini 3.1 Pro把壓力給到OpenAI、Anthropic
上周,Google剛剛發佈了Gemini 3 Deep Think工具,旨在解決科學、研究和工程領域面臨的現代挑戰,今天,這款工具背後的核心智能模型——Gemini 3.1 Pro正式推出。此次發佈也是Google首次對Gemini模型進行“0.1”版本形式迭代,市場分析認為,今年該公司發佈策略可能會從定期發佈完整版本轉向更頻繁的增量升級。在廣受歡迎的“人類最後的考試”(Humanity's Last Exam)基準測試中,Gemini 3.1 Pro取得了創紀錄的44.4%的成績,上一代Gemini 3 Pro的成績為37.5%,而OpenAI的GPT 5.2的成績為34.5%,Anthropic的Opus 4.6成績為(40.0%)。在ARC-AGI-2 基準測試中,該測試旨在評估模型解決全新邏輯模式的能力,3.1 Pro的驗證得分達到了77.1%,比3 Pro的推理性能提升了一倍以上,這一結果也超越了GPT-5.2(52.9%)以及Opus 4.6(68.8%)。從官方披露的資料看,Google在多數指標上取得了業內領先優勢,但目前仍有個別基準測試的最好成績被OpenAI和Anthropic佔據,前沿大模型之爭十分焦灼。翻倍的性能和推理能力Google方面表示,3.1 Pro模型專為那些簡單答案不足以解決的任務而設計,它善於運用高級推理能力,幫助使用者應對最棘手的挑戰。無論是需要對複雜主題進行清晰直觀的拆解分析,還是需要將複雜資料整合到單一檢視中,亦或是需要將創意項目變為現實,官方給到一些典型應用案例如:基於程式碼的動畫:3.1 Pro可以直接根據文字提示生成可用於網站的動畫SVG。由於這些動畫完全由程式碼而非像素構成,因此無論縮放比例如何,它們都能保持清晰銳利,並且與傳統視訊相比,檔案大小也極小。複雜系統綜合:3.1 Pro利用高級推理技術彌合了複雜API與使用者友好設計之間的差距,該模型建構了一個即時航空航天儀表盤,成功配置了公共遙測流,可以可視化國際空間站的軌道。互動設計:3.1 Pro可生成複雜3D鳥群舞動畫,生成視覺程式碼並建構沉浸式體驗,使用者可通過手部追蹤操控鳥群,聆聽隨鳥群運動變化的生成式配樂,為研究人員和設計師提供建構感官豐富介面原型的強大方法。創意編碼:3.1 Pro可以將文學主題轉化為功能性程式碼,當被要求為《呼嘯山莊》建構一個現代個人作品集時,該模型並非簡單地概括文字,而是深入分析了小說的氛圍基調,設計出一個簡潔現代的介面,最終建立了一個能夠捕捉主人公精髓的網站。GoogleDeepMind工作人員還演示使用3.1 Pro開發逼真的城市規劃應用程式,該模型可以處理複雜地形、繪製基礎設施圖以及模擬交通資料,從而生成高品質的可視化效果。性價比打壓競爭對手對於開發者而言,3.1 Pro版本最引人注目的亮點不僅在於性能大幅提升,也在於其“性價比”。第三方分析平台Artificial Analysis的評估顯示,Google以更低的成本實現最先進的智能。3.1 Pro版本在人工智慧分析指數中得分最高,其最顯著的優勢在於價格和代幣效率,與Claude Opus 4.6 (max) 和GPT-5.2 (xhigh) 相比,Gemini 3.1 Pro Preview上的運行成本降低了50%以上。如果Google的慣例保持不變,那麼在不久的將來,其速度更快、成本更低的Flash模型很可能也會推出3.1版本更新。加盟Google的華人AI研究員姚順宇發推表示,更好的模型正以勢不可擋的速度湧現。One more Thing隨著大模型廠商的市場競爭加劇,頭部廠商CEO之間的關係並不融洽。在日前印度舉辦的人工智慧影響力峰會上,出現了本年度AI圈最尷尬一幕:OpenAI首席執行長Sam Altman和Anthropic首席執行長Dario Amodei拍照時明顯拒絕牽手,而是雙雙舉起了拳頭,台上其他AI廠商領袖(如Google、Meta)則在拍攝合影時都儀式性挽著胳膊。今天,兩人不和的合影畫面迅速在社交媒體上流傳開來,網友調侃,什麼時候能實現AGI?可能得等到Sam和Dario牽手那天。2026年2月12日,Anthropic完成G輪融資籌集了300億美元,投後估值達3800億美元,該公司透露已實現140億美元的年化收入規模。據彭博社最新爆料,OpenAI正在籌備新一輪融資,據悉此次融資規模有望達1000億美元,公司整體估值可能超過8500億美元,OpenAI首席財務官Sarah Friar此前表示,公司2025年年化營收已超200億美元。面對Google的強力競爭,兩大AI獨角獸都紛紛加碼投入不敢絲毫鬆懈迭代步伐。在本年開局的首輪大模型PK賽中,國內外主流廠商的旗艦模型再次刷出性能新高度,目前備受網友期待的便是傳聞的DeepSeek新一代模型V4,能否創造出更多驚喜可以拭目以待。 (頭部科技)
Google發佈Lyria 3 AI音樂模型,Gemini一鍵生成30秒高保真歌曲
Google旗下DeepMind發佈了最新AI音樂生成模型Lyria 3,該模型已率先整合至Gemini桌面端應用,未來幾日將逐步登陸移動端,面向全球18歲及以上使用者免費開放。據悉,作為Lyria系列模型的重大升級版本,Lyria 3支援通過文字、圖片、視訊等多模態輸入生成原創音樂,進一步降低了音樂創作的專業門檻,同時聯動YouTube生態,為內容創作者提供全新工具。根據官方介紹,Lyria 3相較於前代模型實現了三大核心升級。首先,該模型支援自動生成歌詞,使用者無需自行撰寫,只需通過提示詞描述音樂的主題、風格或情緒,模型便可自動創作匹配的歌詞與旋律。其次,使用者可實現更精細的創作控制,通過提示詞精準指定曲風、人聲類型、節奏速度等音樂元素。此外,Lyria 3生成的音軌在樂器層次、人聲真實感和音樂結構上均有顯著提升,音質更接近專業製作水準,打破了前代模型輸出內容相對單薄的侷限。在使用場景與操作便捷性上,使用者只需打開Gemini應用,在“工具”下拉菜單中找到帶有音符圖示的“音樂”選項,即可啟動創作功能,Google同步發佈的Lyria 3提示詞指南,可幫助使用者快速上手。此外,Lyria 3不僅整合於Gemini應用,還同步接入了YouTube的Dream Track功能,助力短影片創作者為Shorts生成定製化背景音樂,該功能此前僅面向美國使用者,此次隨Lyria 3的發佈向全球擴展。此外,開發者可通過Google Cloud上的Vertex AI API使用Lyria模型(當前API版本為lyria-002),以程式設計方式生成音樂,適配視訊配樂、廣告創作、遊戲音效製作等商業場景。使用權限方面,Lyria 3目前支援英語、德語、西班牙語、法語、印地語、日語、韓語和葡萄牙語8種語言,後續將逐步增加更多語言支援。所有18歲及以上的Gemini使用者均可免費使用該功能,而訂閱Google AI Plus、AI Ultra等付費服務的使用者,將享有更高的音樂生成額度,具體額度Google暫未明確披露。 (TechWeb)
Google,再掀AI戰火
周三(2月18日)美股盤中,Google在官網部落格中宣佈,Gemini應用已配備公司最先進的音樂生成模型Lyria 3,使用者可使用文字或圖像製作30秒的音樂片段。新聞稿稱,“只需描述一個想法或上傳一張照片,Gemini就能在幾秒鐘內將其轉化為一首高品質、朗朗上口的歌曲。為了進一步拓展創意空間,您甚至可以讓Gemini從上傳的內容中汲取靈感。”根據Google的說法,Gemini不僅可以“文字轉歌曲”,還可以通過“上傳照片或視訊”創作一首完美契合氛圍的歌曲,歌曲長為30秒,並配有Nano Banana設計的自訂封面。另外,創作者還可以通過YouTube的Dream Track功能探索Lyria 3,以提升Shorts短影片配樂的品質。Google稱,Lyria 3已在美國推出,並正在逐步推廣至其他地區的創作者。Google提到,Lyria的音訊生成功能採用了公司最新的隱私和安全特性,所有生成的曲目都使用SynthID技術加入了不易察覺的水印,可以檢測音樂是否由人工智慧創作或編輯。消息公佈後,歐美主流串流媒體音樂服務平台Spotify(股票程式碼:SPOT)股價回吐了日內近5%的漲幅,Sirius XM(股票程式碼:SIRI)也一度轉跌。有分析表示,雖然Google的音樂生成模型預計不會成為Spotify的致命打擊,但這些舉措可能迫使後者盡快推出AI混音功能。另外,把音訊創作工具加入移動應用,有望增強Google的消費者產品競爭力。對於Google來說,公司需要持續向投資者證明其AI產品投入能夠帶來收入增長。生成式AI工具在音樂行業一直受到謹慎甚至敵視的對待,許多從業者認為其可能威脅商業模式和智慧財產權。Google在部落格中強調,其系統設有保護措施,禁止AI直接挪用特定藝術家的作品。如果使用者點名真實音樂人,Gemini只會將其視為“廣泛的創作靈感來源”,生成風格或氛圍與之相似的曲目。 (財聯社)
4000億美元營收,1300億美元淨利潤,Google的強大超過了很多人想像
軟硬結合的Google,已經有了與OpenAI、輝達一決高下的資本,其強大程度超過了很多人的想像。1 營收突破4000億美元前不久,Google母公司Alphabet(下稱:Google)公佈了2025年第四季度業績以及2025年全年財報。資料顯示,2025年第四季度,Google總營收錄得1138.28億美元,同比增長18%,淨利潤345億美元,同比增長30%;稀釋每股收益2.82美元,同比增長31%,三項核心指標均超出華爾街一致預期。從2025年全年來看,Google總營收規模達到4,028億美元,同比增長15%,Google也成為歷史上首家年營收突破4,000億美元的科技公司。淨利潤方面,Google2025年淨利潤達到1321.7億美元‌,同比增長32%,主要得益於AI技術落地與Google雲業務的高速擴張。對此,Alphabet首席執行長桑達爾·皮查伊在財報聲明中表示,2025年第四季度對於Google來說是“一個表現極為出色的季度”,公司年度營收首次突破4000億美元,搜尋、雲與訂閱業務實現了持續擴張。同時,Gemini應用也實現了顯著的規模與深度增長,月活躍使用者達到7.5億,更關鍵的指標是使用者參與度的躍升,包括使用頻率、會話深度和使用者留存率在全球各平台均顯著改善。從營收構成上看,Google主營業務共分為Google服務、Google雲以及Google其他投資(人工智慧、機器人、自動駕駛汽車、醫療)三部分;其中,Google服務又分為廣告業務和Google其他(Google Play、硬體、YouTube訂閱收入)兩部分,而廣告業務主要由搜尋、YouTube和網路聯盟廣告三部分組成,屬於Google最為核心的基本盤業務。財報顯示,2025年第四季度,Google搜尋廣告業務實現營收630.73億美元,同比增長16.7%,超過分析師預期的614億美元,基本盤表現穩健。對此,Google管理層在電話會議中表示,搜尋業務的繁榮主要得益於垂直領域的繁榮,尤其是零售業拉動了廣告商表現。Google雲業務實現營收176.64億美元,同比增長48%,這一增長遠高於雲端運算行業平均增速,同時也明顯優於競爭對手微軟Azure的同期表現。截至2025年年末,Google雲的年化營收已經超過700億美元,未履行訂單金額高達2400億美元,同比增長超一倍,主要由企業AI基礎設施、企業AI解決方案以及核心Google雲平台產品需求激增驅動。在營收保持高增長的同時,Google雲業務盈利能力也有了明顯的提升。2025年第四季度,Google Cloud營業利潤率從上一年的17.5%飆升至30.1%,營運利潤達53.13億美元,同比增幅高達154%。在經歷了數年的高資本投入之後,Google雲業務已經迎來收穫期。其他業務方面,YouTube廣告實現營收114億美元,同比增長9%,略低於市場預期的118億美元。有分析認為,2024年同期的美國大選所帶來的政治廣告高基數效應成為油管廣告本季度營收不及預期的一個主要原因。以YouTube會員訂閱、Google Play以及Pixel硬體等為主的其他收入共實現營收136億美元,主要得益於YouTube會員以及Google One等業務的增長。包括自動駕駛公司Waymo以及生命科學部門Verily等在內的非核心業務部門(Other Bets)實現銷售收入3.70億美元,較上年同期(4億美元)下降8%,淨虧損高達36億美元,主要是因為Waymo在本季度確認了21億美元的員工股權補償費用。而就在四季度財報發佈的前幾天,Waymo宣佈完成160億美元新一輪融資,投後估值達1,260億美元,Waymo也成為全球首家估值突破千億美元的Robotaxi超級獨角獸。2 資本開支翻倍引爭議整體來看,在AI的助力之下,Google四季度業績全面超出此前的市場預期。然而,由於公司2026年資本支出(1750億至1850億美元)同樣大幅超出了投資者的預期,Google股價在財報公佈之後一度下跌超過6%,Google的長期主義與華爾街的業績短視再次迎來一次重大分歧。資料顯示,2025年第四季度,Google資本支出達到279億美元,較去年同期的143億美元接近翻倍。2025年全年,Google資本開支最終錄得914.5億美元,較上一年同期(525億美元)增長77%。由此計算,Google2026年度資本開支增幅接近100%。對此,GoogleCEO桑達爾·皮查伊在財報電話會議上表示,對AI的投入和相關基礎設施建設正在全面帶動營收和增長。為滿足客戶需求,並把握未來不斷擴大的發展機遇,預計2026年資本支出將在1750億至1850億美元之間,這筆支出主要用於伺服器和資料中心基礎設施,以支援人工智慧的發展。近年來,二級市場投資者已經先後多次對於Google的高資本開支表示“不滿”。2024年上半年,Google資本開支達到250億美元,同比幾乎翻倍。出於投資者對其資本支出過高的擔憂,Google股價在2024年第三季度經歷了明顯的下滑,總市值蒸發超過5000億美元。2024年第四季度財報資料顯示,Google當季資本支出達到140億美元,同比增長30%,明顯高出了此前約130億美元的指引。與此同時,為了應對高性能計算晶片供給不足的問題,Google決定在2025年大力加碼資本開支用於擴展AI基建,預計資本開支高達750億美元,比普遍預期的588億美元高出約30%。財報公佈次日,Google股價跌超7%,市值一夜時間蒸發超過1800億美元。但從事後來看,投資者對於Google“過度投資”的擔憂明顯有些杞人憂天。從2025年全年來看,Google實際的資本開支金額(914.5億美元)已經大幅超出了最初的預期資料(750億美元),但這並沒有阻礙Google業績的超預期增長以及股價的飆升。2025年全年,Google股價累計上漲約‌66%,創下自2009年金融危機以來的最佳年度表現,並與輝達一同躋身4兆美元市值俱樂部。事實上,自ChatGPT橫空出世以來,有關搜尋引擎將被顛覆的討論便不絕於耳,Google也被貼上了“中年危機”的標籤。然而,所謂Google將淪為“下一個雅虎”的擔憂並沒有成為現實。相反,隨著Gemini 3大語言模型、Nano Banana圖像生成模型、Veo3視訊生成模型以及TPU晶片等一系列重磅產品的推出,崇尚長期主義的Google最終還是奪回了AI技術制高點,公司股價也隨之飆升。而正如研究機構DA Davidson的分析師Gil Luria所說,“Google雲的增長遠超預期,而且更重要的是,這是幾年來首次超過微軟Azure的增長速度。這似乎證明了,Google增加資本支出是合理的。”3 從Gemini 3到TPU晶片2025年11月19日,Google正式推出了最新的Gemini 3系列人工智慧模型,並同步上線Gemini 3 Pro預覽版。據悉,Gemini 3配備100萬token上下文窗口,在圖像、視訊、音訊與程式碼的深度融合處理上實現了里程碑式的突破,讓AI具備理解複雜場景、跨模態分析與自主執行任務的綜合能力。在一項涵蓋專家知識、邏輯推理、數學及圖像識別等多科目的測試中,Gemini 3得分均顯著領先於包括ChatGPT在內的其他公司的最新模型。憑藉著躍進式的得分提升、強大的多模態理解力、更加多樣化的UI以及驚豔的前端能力,Gemini 3被廣泛認為是當前性能頂尖的AI模型之一,同時也被視為Google在AI競賽中重新佔據高點的重要節點。事實上,從上一代Gemini 2.5開始,Google在“前沿模型”上的實力就已經逐步追上甚至超越競爭對手。而隨著Gemini 3 Pro的推出,Google更是有了與OpenAI正面PK的實力。對此,就連矽谷大佬、軟體公司賽富時(Salesforce)首席執行長馬克·貝尼奧夫(Marc Benioff)曾公開表示,Gemini 3在推理、速度和多模態能力方面實現了“瘋狂”的飛躍,其本人在Gemini 3上僅花了兩小時後便不想再回到ChatGPT。與此同時,Google還同步推出了全新的AI開發平台Google Antigravity,為開發者提供建構自主智能體(Agent)的全端工具鏈。通過該平台,開發者可以更輕鬆地建構具備任務規劃、工具呼叫和多步驟執行能力的AI應用,推動AI從“助手”向“合作夥伴”轉變。財報資料顯示,截至2025年年末,Google Gemini月活使用者突破7.5億,較2025年Q3淨增1億,距離ChatGPT(月活8.1億)只有6000萬人的差距。此外,在企業客戶的維度上,Gemini還成功幫助Google拿下了蘋果這一重量級客戶,引發行業巨震。2026年1月12日,蘋果與Google發佈聯合聲明,宣佈達成多年合作協議。根據協議,下一代蘋果基礎模型(Apple Foundation Models)將基於Google的Gemini模型及其雲技術建構,這些模型將為未來的蘋果智能功能提供支援,包括今年即將推出的更加個性化的Siri。在這一重磅消息的刺激下,Google市值首次突破4兆美元大關,成為繼輝達、微軟、蘋果之後的第四家突破4兆美元的上市公司。值得注意的是,Gemini 3使用的是Google自家TPU晶片,而非驅動OpenAI系統的輝達晶片。因此,Gemini 3的成功一度讓二級市場產生了“TPU恐慌”。2025年11月25日,輝達股價早盤大跌超7%,總市值一日內蒸發1150億美元。如果說Gemini 3的發佈讓Google在大模型領域成功逆襲,那麼TPU晶片的外供又讓Google有了叫板輝達的資本。據悉,Google加速器TPU(Tensor Processing Unit,張量處理單元)是Google自主研發的人工智慧專用晶片,主要用於加速機器學習和AI計算任務。2015年,Google第一代TPU在極度保密狀態下問世,此後主要為搜尋、Gemini模型等內部服務所設計,已形成強大的內部需求閉環。2023年10月,Google第七代TPU(TPU v7,代號Ironwood)正式問世,其性能較第六代TPU提升了10倍,單晶片算力達到1 exaFLOP(FP8精度)。有資料顯示,TPU v7在推理能效上較輝達A100提升1.9倍,更適配Agent型AI的即時計算需求。此外,作為TPU歷史上第一款專用推理晶片,GoogleTPU v7具有更為明顯的成本優勢。伯恩斯坦研究資料顯示,同等算力下TPU的能耗成本比輝達H100低42%,硬體採購價僅為後者的50%-70%。因此,對Meta等年算力支出超百億美元的科技巨頭而言,轉向TPU就意味著每年節省數十億美元。2025年10月,AI創業公司Anthropic宣佈將使用多達100萬個GoogleTPU晶片來訓練其Claude大模型,總價值達到數百億美元。除了Anthropic之外,GoogleTPU的外部客戶名單還包括蘋果、Meta、Cohere等巨頭。摩根士丹利最新研報資料顯示,GoogleTPU在2027年的產量預測從約300萬塊大幅上調至約500萬塊,增幅約67%,TPU外銷正成為Google一項前景廣闊的新業務。在AI軍備競賽日益白熱化的背景下,Google憑藉高強度的研發投入以及創新的AI技術堆疊模式(AI infrastructure、Models、AI Platform、AI Agents)構築了獨特的算力護城河,在TPU晶片、人工智慧超級電腦架構、軟體以及大模型等各個層面均保持著極強的競爭力,進而擁有了“拳打OpenAI,腳踢輝達”的實力。顯然,軟硬結合的Google已經有了與輝達一決高下的資本,其未來發展值得進一步期待。 (礪石商業評論)
Google太狠了!接入 Gemini 3 後的 Stitch,審美能力簡直“逆天”!
我想做APP、想做小程序、想做網站,但是我不會設計UI怎麼辦?有兩種方式,第一種,直接寫程式碼,讓大模型幫你自動生成。但是這種方式有個問題,那就是初始提示詞很重要,你可以指定一個參考風格或者提供參考圖,但是出來之後有幾分相似就不太好保證了,假設你對整體風格不滿意,那恐怕要重新生成了。浪費了很多 token,那都是錢啊。第二種,那就是先生成 UI 設計圖。但前面不是說了嗎,不會設計UI啊。沒關係,你不會,AI會啊。Google 給咱們提供了一種方式,直接通過提示詞生成UI設計圖。等有了UI效果圖後,再讓AI根據圖片生成程式碼,那就能完美還原了。這個產品叫做 Stitch,已經發佈一段時間了,之前效果一般,用不用其實區別也不大。但現在不一樣了, 前幾天,Google 將 Gemini 3 接入進來了,審美能力大幅度提高,絕對是一個普通人做 UI 圖的不二選擇。線上使用地址: https://stitch.withgoogle.com/使用方式這是一個線上網站,通過上面的地址進入之後。可以選擇移動應用或者 Web 應用,輸入框中輸入你的需求和設計風格,如果你不知道用什麼風格,也可以只講需求,讓它自己發揮。輸入框右下模型選擇區域可以選擇模型版本,默認是 Gemini 3 Flash,可以選擇 Pro。如果追求更高品質的話,還可以用 Nano Banana Pro 生成高畫質圖片。另外,左側有幾個示例項目,可以參考官方的提示詞是怎麼寫的。下面我來做個演示,準備設計一個拍照類的 APP。在輸入框中輸入我的提示詞,選擇手機應用,模型選擇 Gemini 3 Pro,然後點傳送按鈕。設計一個拍照APP,用來指導使用者進行某些特定的姿勢拍照,比如在某些風景前拍出本地人的自然狀態,最好有人物姿勢剪影,方便使用者擺姿勢。拍出的照片自動加白色邊框,並在合適的角落加入照片的水印資訊,照片整體效果類似於拍立得效果。還要有照片查看介面,照片預覽介面。還有一個照片編輯頁面,可以換背景、濾鏡等。等待幾分鐘,Gemini 3 注重效果,所以速度上會慢一些。最終效果如下,上面是深色主題,下面是淺色主題。之後,如果你對其中某張圖不滿意,可以選中這張圖。被選中的圖會自動進入左側聊天窗口,描述你想要的更改。或者直接在上方的 Generate 下拉框中選擇重新生成或者變體,相當於隨機換一個。還可以在選擇的圖片上方的 Edit 下拉按鈕中僅需主題修改和細節修改。點選 Annotate,進入細節編輯介面,在這裡,你可以框選想要修改的局部,然後輸入提示詞,即可完成局部效果的修改。點選修改主題,右側會出現外觀、顏色、字型等修改選項。除此之外,還可以選中多張圖片,在 Generate 這裡可以生成互動原型。這就像用原型工具製作可互動的產品原型圖那樣,可以查看多個頁面之間的互動、跳轉過程,用來給別人演示,或者自己提前查看效果。下面是互動演示效果:最後,可以將程式碼複製、下載或匯出到其他平台。如果是一個 Web 應用,可以直接選中一套,然後匯出到 AI Studio,可直接在 Gemini 3 App 中生成完整程式碼。寫在最後Stitch 最大的價值在於它提供了一個可控的中間層,讓你提前把最終效果圖拿到。避免直接用程式碼生成時,多次不滿意而調整浪費 Token。如果你手頭正好有想做的 App、小程序或者網站,苦於沒有設計靈感,不妨去試一試。 (古時的風箏)